RDD相关论文
研究低碳城市试点政策对企业技术创新的影响对于实现我国经济增长和环境保护的双赢具有重要意义。文章以2005-2019年沪深两市A股上......
随着云平台以及相关技术的进步发展,人们开始将越来越多的工作交付计算机集群来处理。其中比较有代表性的就是对海量视频数据的处......
伴随着日益增长的大数据相关的业务需求,大数据计算在科研领域及企业界都有着广泛的应用,例如数字图像处理、用户需求的预测等等,......
学位
大数据及其相关处理技术成为当今计算机科学领域和工业界最重要的技术之一,最为崭新的知识获取范式,商业公司和学术科研组织已经将......
伴随着计算机技术的飞速发展和互联网的深入应用,尤其是Web2.0的成熟与广泛应用,数据呈爆炸式增长。传统的数据分析方法受到很大限......
阐述了早期压制快速反应喷头的工作特点,三个参数RTI、ADD和RDD的概念及其相互关系,强调了ESFR喷头的作用是对火灾的早期压制.......
随着大数据时代的到来,传统的单机模式已经不能满足大规模数据分析处理的需求.Spark是专门针对海量数据设计的通用并行计算引擎.Sp......
目的:探讨舍曲林联合舒肝解郁胶囊治疗复发性抑郁障碍患者的临床疗效和安全性。方法将100例复发性抑郁障碍患者按照就诊顺序随机分......
针对现实中许多超大规模图可达性查询的问题,提出了一种新的基于递归分解的算法,即将原图递归分解成一系列生成树和剩余图两类子图......
摘要:研究了Spark并行计算集群对于内存的使用行为,认为其主要工作是通过对内存行为进行建模与分析,并对内存的使用进行决策自动化,使......
通过高速CCD摄影机和高性能摄像机对一定量的TNT炸药爆炸产生的火球和烟云的运动过程进行了记录,按照实时记录结果,将爆炸分为火球......
极限学习机算法虽然训练速度较快,但包含了大量矩阵运算,因此其在面对大数据量时,处理效率依然缓慢。在充分研究Spark分布式数据集并......
多序列星比对算法在确定中心序列时需要计算任意两个输入序列的距离及分数,其较高的时间复杂度耗费了大量时间,因此提出了通过综合......
本文分析了RDD恐怖事件威胁存在的现实可能性和危害,并结合几个具体地点上模拟RDD场景造成的后果,论述了RDD防范和后果管理的重要性......
为解决幂迭代聚类算法并行实现中存在的编程繁琐、效率低下等问题,基于Spark大规模数据通用计算引擎及其Graph X组件,提出了一种在......
随着大数据时代的来临,传统的计算模式已经不足以支撑如此大量的数据。基于内存计算的大数据并行化计算框架Spark的出现很好地解决......
分布式内存计算平台Spark是海量数据处理领域的最新技术进展。RDD是Spark中海量数据的抽象表达。交互式应用是Spark平台的一类典型......
学位
随着大数据时代的到来,大数据机器学习成为了重要的研究热点。电商网站越来越重视对于用户推荐系统的搭建,然而推荐系统对于要过滤......
分布式计算框架为各领域大数据应用推广提供了计算平台,Hadoop下的MapReduce框架为批量数据的分布式计算提供了有效途径。然而,其......
随着云计算与大数据技术的迅速发展,Spark作为一种基于内存计算的大型数据处理框架已被广泛应用。为提升任务执行效率,针对该平台......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
学位
Spark作为基于内存的计算框架,在保留了MapReduce计算模型的容错机制的同时,将数据交换从磁盘级别提高到内存级别,极大提高了大数......
在迭代之间使用内存做数据传输的并行计算框架是当前的一个研究热点。与传统的基于硬盘和网络的计算方式相比,使用内存可以减少数......
随着电力信息化的深入发展及移动互联网的普及,电力业务的数据结构日益复杂,数据规模呈现海量增长趋势,使得原有基于传统关系型数......
伴随着云时代的来临,大数据一词被越来越多地提及并认识,人们也越来越多地意识到数据的重要性并尝试去挖掘掩藏在其中的价值。大数......
为解决单机环境下地震属性计算处理效率低下问题,提出基于分布式并行框架Spark的地震属性迭代处理方法,构建满足并行计算需求的地......
互联网文本数据量的激增使得对其作聚类运算的处理时间显著加长,虽有研究者利用Hadoop架构进行了k-means并行化研究,但由于很难有......
Apache Spark是当前流行的大数据处理统一引擎,具有通用、高效、易用等特点。Apache Spark是针对Map Reduce在交互式数据挖掘、迭......